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Abstract of DE 19926538 (A1) 

The hardware has a decoupled configuration register and performs programs on a component with a 
single or muiti-dlmenslonal cell structure. Data flow or control flow graphs are partitioned into time- 
separated sub-graphs and formed sequentially and implemented on the component An Independent 
claim is also included for a method for performing programs on a component with a single or multi- 
dimensional cell structure. 
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Beschreibung 
Aufgabe der Erfindung und Anwendungsbereiche 

5 Die vorliegende Erfindung erstreckt sich auf das Gebiet von programmierbaren und insbesondere wShiend des Betrie- 
bes umprogrammierbaren arithmetischen und/oder logischen Bausteinen mit Vielzahl von arithmetischen und/oder logi- 
schen Einheiten, dercn Verschaltung ebenfalls programmierbar und wahrend des Betriebcs umprogrammierbar ist. Der- 
artige logische Bausteine sind unter dem Oberbegriflf FPGA von verschiedenen Firmen verfugbar. Weiterhin sind meh- 
rere Patente veroffentlicht, die spezielle arithmelische Bausteine mit automatischer Datensynchronisation und verbesser- 

10 ten offenlegen. 

Samtliche beschriebene Bausteine besitzen eine zwei- oder mehrdimensionale Anordnung von logiscben und/oder 
arithmetischen Einheiten, die iiber Bussysteme mitdnander verschaltbar sind. 

Aufgabe der Erfindung ist es, ein Progranmiierverfahren zur Verfiigung zu stellen, das es ermogiicht die beschriebenen 
Bausteine in gewobnlichen Hochsprachen effizient zu programmieren und dabei die Vorteile der durch die Vielzahl von 
15 Einheiten entstehende Parallelitat der beschriebenen Bausteine weitgehend automatisch, vollstandig und efl&zient zu nut- 
zen. 

Stand der Technik 

20 Bausteine der genannten Gattung werden zumeist unter Verwendung gewohnlicher Datenflussprachen programmiert 
Dabei tret«i zwei grundlegende Probleme auf: 

1 . Die Progranunierung in Datenflussprachen ist fiir Progranunieier gewdhnungsbeduiftig, def sequentielle Aufga- 
ben lassen sich nur sehr umstandlich beschreiben. 
25 2. GroBe Applikationen und sequentielle Beschreibungen lassen sich mit den bestehenden t}bersetzungsprogram- 
men (Synthese-Tools) nur bedingt auf die gewunschte Zieltechnologie abbilden (synthetisieren). 

Fiir gewc^nlich werden Applikationen in mehrere Teilapplikadonen partidoniert, die dann einzeln auf die Zieltechno- 
logie synthedsiert werden (Fig. 1). Die einzelnen Binarcodes werden dann auf jeweiis einen Baustein geladen. V^ent- 
30 liche Voraussetzung der Erfindung ist das in DE 44 16 881 beschriebene Verfahren, das es ermogiicht, mehrere partitio- 
nierte Teilapplikadonen innerhalb eines Bausteines zu nutzen, indem die zeitliche Abhangigkeit analysis wird und uber 
Steuersignale sequendell die jeweiis erforderlichen Teilappllkationen bei einer Qbeigeonlneten Ladeeinheit angefordert 
und von dieser daraufhin auf den Baustein geladen werden. 

Exisderende Synthese-lbols sind nur bedingt in d^ Lage Rogramm-Schleifen auf Bausteine abzubilden (Fig. 2 

35 (0201)). 

Dabei werden sogenannte FOR-Schleifen (0202) als Primidv-Schleife haufig noch dadurch unterstutzt, daB die 
Schleife vollkommen auf die Ressourcen des Zielbausteines ausgewalzt werden. 

WHELE-Schleifen (0203) besitzen im Gegensatz zu FOR-Schleifen keinen konstanten Abbmchswert Vielmehr wird 
durch eine Bedingung evaluiert, wann der Schleifenabbruch stattfindet. Daher ist gewohnlicherweise (wenn die Bedin> 
40 gung nicht konstant ist) zur Synthesezeit nicht bekannt, wenn die Schleife abbricht. Durch das dynamische V^ihalten 
konnen Synthese-Tools diese Schleifen nicht fest auf Hardware abgebildet d. h. auf einen Zielbaustein iibertragen wer- 
den. 

Rekursionen sind gnindsatzlich nicht auf Hardware abbildbai; wann die Rekursionsdefe nicht zur Synthesezdt be- 
kannt und damit konstant ist Bei der Rekursion werden mit jeder neuen Rekursionsebene neue Ressourcen allokiert Das 
45 wUrde bedeuten, daB mit jeder Rekursionsebrae neue Hardware zur VsrfUgung gestellt werden muB, was aber dynamisch 
nicht moglich ist. 

Selbst einfache Grundstrukturen sind von Synthesetools nur dann abbildbar, wenn der Zielbaustein ausreichend groB 
ist, d. h. ausreichende Ressourcen bietet. 

Einfache zeitliche Abhangigkeiten (0301) werden durch heutige Synthese-Tools nicht in mehrere Tfeilapplikationen 
50 partitioniert und sind deshalb nur als Ganzes auf einen Zielbaustein ubertragbac 

Bedingte Ausfuhrungen (0302) und Schleifen uber Bedingungen (0303) sind ebenfalls nur abbildbar, wenn ausrei- 
chende Ressourcen auf dem Zielbaustein existieren. 

ErfindungsgemaBes Verfahren 

55 

Durch das in DE 44 16 881 beschriebene Verfahren ist es moglich Bedingungen zur Laufzeit innedialb der Hardware- 
strukturen der genannten Bausteine zu erkennen und derart dynamisch darauf zu reagieren, daB die Funkdon der Hard- 
ware entsprechend der eingetretenen Bedingung modifiziert wird, was im wesentllchen durch das Konfigurieren einer 
neuen Struktur geschieht. 

60 Ein wesendicher Schritt in dem erfindungsgemaBen Verfahren ist die Partitionierung von Graphen in zeidich unabhSn- 

gige Teilgraphen. 

Der Begriff "zeidiche Unabhangigkeit" wird damit definiert, daB die Daten, die zwischen zwei Teilapplikadonen iiber- 
tragen werden durch einen Speicher, gleich welcher Ausgestaltung (also auch mittels einfacher Register), entkoppelt 
werden. Die ist besonders an den Stellen eines Graphen moglich, an denen eine klare Schnittstelle mit einer begrenzten 
65 und moglichst minimalen Menge von Signalen zwischen den beiden Teilapplikadonen besteht. 

Die zeidiche Unabhangigkeit kann in groBen Graphen durch das gezielte Einfiigen von klar definierlen und moglichste 
einfachen Schnittstellen zum Speichem von Daten in einen Zwischenspeicher herbeigefiihrt werden (vgl. Sn in Fig. 4). 
Schleifen weisen gnindsatzlich eine starke zeidiche Unabhangigkeit auf, da sie lange Zeit iiber einer besdnunten Menge 
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von (zumeist) in der Schleife lokalen Variablen arbeiten und nur beim Schleifeneintiitt und beim veriassen der Schleife 
eine tJbertragung der Opmnden bzw. des Ezgebnisses erfordern. 

Durch die zeitliche UnabhSngigkeit wird erreicht, daB nach der vollstandigen AusfUhrung einer Ibilapplikation die 
nachfolgende Ibilapplikadon geladen werden kann, ohne daB iigendwelche weiteien AbhSngigkeiten oder £influsse auf- 
treten. Beim Speichem dor Daten in den genannten Speicher kann ein Signal flVigger) generiert werden, das die ubeige- 5 
ordneten Ladeeinheit zum Nachladen der nachsten Teilapplikation aufFordert. Der Trigger kann bei der Verwendung von 
einfachen Registem als Speicher immer generiert werden, virenn das Register beschrieben wird. Bei der Verwendung von 
Speichem, i. b. von soichen die nach dem FIFO-Prinzip arbeiten, ist die Generiening des IHggers von mehrercn Bedin- 
gungen abhangig. 

Folgende Bedingungen konnen beispielsweise einzein oder kombini^ ein THgger erzeugen: lo 

- Ergebnis-Speicher vol] 

- Operanden-Speicher leer 

- keine neuen Operanden 

- Beiiebige Bedingung innerhalb der Teilapplikation, generiert durch z. B. is 

- Veigleicher 

- Zahler. 

Eine Teilqjplikation wind im folgenden auch Modul genannt, urn die Verstandlichkeit aus Sicht der klassischen Pro- 
grammierung zu erhohen. Aus demselben Grund werden Signale im folgenden auch \^ablen genannt Dabei unter- 20 
scheiden sich die Variablen in einem Punkt wesentlich von herkommlichen Variablen: Jeder Variable ist ein Statussignal 
(Ready) zugeordnet, das anzeigt, ob die Variable einen gultigen Wert besilzt. Wenn ein Signal einen giiltigen (berechne- 
ten) Wert besitzt, ist das Statussignal Ready; wenn das Signal keinen gultigen Wert besitzt (Berechnung noch nicht ab- 
geschlossen), ist das Statussignal Not.Ready. Das Prinzip ist ausfiihrlich in der Patentanmeldung PACT02 beschrieben. 

25 

Das Prozessormodeil 

Die in den folgenden Hguren gezeigten Graphen besitzen als Graphenknoten immer in Modul, wobei davon ausge- 
gangen wird, daB mehreie Module auf dnen Zielbaustein abgebildet werden konnen. Das heiBt, obwohl alle Module zeit- 
lich voneinander unabhangig sind, wild nur bd nach den Modulen eine Umkonfiguration durchgefuhrt, bzw. ein Daten- 30 
speicher eingefiigt, die mit einem vertikalen Stricb und At maridert sind. Dies^ Punkt wird Umkonfiguradonszeitpunkt 
genannt 

Das bedeutet zusammenfassend: 

1 . GroBe Module konnen an geeigneten Stellen partitioniert werden und in kleine zeitlich voneinander unabhangige 35 
Module zerlegt werden. 

2. Bei kleinen Modulen die sich gemeinsam auf einen Zielbaustein abgebildet werden konnen, wird auf die zeitli- 
che Unabhangigkeit verzichtet. Dadurch woxien Konfiguradonsschritte dngespart und die Datenveraibeitung be- 

schleunigt 

3. Die Umkonfiguradonszeitpunkte werden entsprechend der Ressouroen der Zielbausteioe posidoniert Dadurch 40 
ist eine beiiebige Skalierung der Graphenlange gegeben. 

In Fig. 4a sind einige gnmdiegenden Hgenschaften des erfindungsgemaBen Verfahrens dargestellt: 
Die Module des l^s A sind zu einer Gruppe zusammengefaBt und besitzen am Ende einen bedingten Sprung, entweder 
nach Bl oder B2. An dieser Position (0401) ist ein Umkonfigurationspunkt eingefugt, da es sinnvoli ist die Zweige des 45 
bedingten Sprunges als jeweils eine Gruppe zu betrachten (Fall 1). Wiirden dagegen beide Zweige von B (Bl undB2) zu- 
satzlich zu A auf den Zielbaustein passen (Fall 2), es sinnvoli nur einen Umkonfiguradonspunkt bei 0402 einzufu- 
gen, da dadurch die Zahl der Konfiguradonen verringert wird und sich die \ferarbeitungsgeschwindigkeit erhoht. Beide 
Zweige (Bl und B2) springen bei 0402 nach C. 

Die Konfiguration der Zellen auf dem Zielbaustein ist in Fig, 4b schematisch dargestellt. Dabei werden die Funktionen 50 
der einzelnen Graphenknoten auf die Zellen des Zielbausteins abgebildet Jeweils eine Zeile stellt eine Konfiguration dar. 
Die gestrichelten Pfeilc bei einem Zeilenwechsel zeigen eine Umkonfiguration. Sn ist eine datenspeichemde Zelle, von 
beliebiger Ausgestaltung (Register, Speicher, etc.). Dabei ist SnI ein Speicher, der Daten entgegennimmt und SnO ein 
Speicher der Daten ausgibt Der Speicher Sn ist fiir gleiche n jeweils derselbe, I und O kennzeichnen die Datentransfer- 
richtung. 55 

Beide Falle des bedingten Sprunges (Fall 1, Fall 2) sind dargestellt 

Das Modell in Fig. 4 entspricht einem DatenfluBmodell, jedoch mit der wesentiichen Erweiterung der Umkonfigura- 
tionspunkt und der damit eneichbaren Partitionierung des Graphen, wobei die zwischen den Partitionen abertragenen 
Daten zwischengespeichert werden. 

Im Modell von Fig. 5a wird aus einer beliebigen Graphenmenge und -Konstellation (0501) selekdv ein Graph aus ei- 60 
ner Menge von Graphen B aufgerufen. Nach der Ausfiihrung von B gelangen die Daten nach 0501 zuriick. 

Wud in 0501 ein ausreichend groBer Sequencer (A) implementiert, ist mit dem Modell dn den typischen Prozessoren 
sehr ahnliches Prinzip implementierbar. Dabei gelangen 

1. Daten in den Sequenzer A, die dieser als Befehle dekodiert und entsprechend dem "von Neumann "-Prinzip dar- 65 
auf reagiert; 

2. Daten in den Sequenzer A, die als Daten betrachtet werden und an ein fest konfiguriertes Rechenwerk C zur Be- 
rechnung weitergeleitet werden. 
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Ver Graph B stellt selektierbar ein besondeies Rechenwerke und/od^ besondere Opcodes fUr bestiminte Funkdonen 
zur Verfiigung und wird altemativ zur Beschleunigung von C verwendet Beispielsweise kann Bl ein optimierter Algo- 
rithmus zu Berechnung von Matrixmultiplikationen sein, wahiend B2 einen FIR-Filt^ und B3 eine Musteierkennung 
s darstellt. Entsprechend eines Opcodes der von 0501 dekodiert wird, wild der geeignete bzw. entspiechende Graph B auf- 
gerufen. 

Fig, 5b schematisiert die Abbildung auf die einzelnen Zellen, wobei in 0502 der pipeiineartige Rechenwerks-Charac- 
ter symbolisiert wird. 

Wahrend in den Umkonfigurationspunkten von Fig. 4 vorzugsweise groBere Speicher zum Zwischenspeichem der Da- 
10 ten eingefiigt werden, ist eine einfache Synchronisation der Daten in den Umkonfigurationspunkten von Fig. 5 ausrei- 
chend, da der Datenstrom vorzugsweise als ganzer durch den Graphen B lauft und der Graph B nicht weiter partitioniert 
ist; dadurch ist das Zwischenspeichem der Daten uberflussig. 

In Fig. 6a sind verschiedene Schieifen dargestellt. Schleifen konnen grundsatziich auf drei Arten behandelt werden: 

15 1 . Hardware- Ansatz: Schleifen werden vollstandig ausgewalzt auf die Zielhardware abgd>ildet (0601a/b). Wiq be- 
reits erl^utert ist dies nur bei wenigen Schldfenarten mdglich. 

2. DatenfluB-Ansatz: Innerhalb der Datenflusses werden Schleifen iiber mehrere Zellen hinweg aufgebaut 
(0602a/b). Das Ende der Schleife wird auf den Schleifenanfang nickgekoppelt. 

3. Sequenzer-Ansatz: Ein Sequenzer mit minimalem Befehlssatz fiihrt die Schleife aus (0603a/b). Dabei sind die 
20 Zellen der Zielbausteine so ausgestaltet, dafi sie den entsprechenden Sequenzer beinhalten (vgl. Fig. 1 la/b). 

Durch eine geeignete Zerlegung von Schleifen kann deren Ausfiihrung ggf. optimiert werden: 

1. Unter Verwendung von Optimierungsmethoden nach dem Stand der Tbchnik lafit sich haufig der Schleifen- 
25 rumpf, also der wiederiiolt auszufuhrende Teil, dadurch optimieren, daB bestimmte Operationen aus der Schleife 

entfemt werden und vor oder hinter die Schleife gestellt werden (0604a/b). Dadurch wird die Menge der zu sequen- 
cenden Befehle erheblich reduziert. Die entfemten Operationen werden nur einmal vor bzw. nach Ausfiihrung der 
Schleife durchlaufen. 

2. Eine weiteie Optimieningsmoglichkeit ist das Teilen von Schleifen in mehrere kleinere oder kurzere Schleifen. 
30 Dabei findet die Ibilung derart statt, daB mehrere parallele oder mehrere sequentielle (0605a/b) Schleifen entstehen. 

Fig. 7 verdeutlicht die Implementierung einer Rekursion. Dabei werden dieselben Ressouicen (0701) in Form von 
Zellen ftir jede Rekursionsebene (1-3) verwendet. Die Ergebnisse einer jeden Rekursionsebene (1-3) werden beim Auf- 
bau (0711) in einen nach dem Stack-Prinzip aufgebauten Speicher (0702) geschrieben. Gleichzeitig mit dem Abbau 
35 (0712) der Ebenen wird der Stack abgebaut 

Hochsprachenbeispiele 
Ein Modui kann beispielsweise folgendermaBen deklariert werden: 
m odul e exainplel 

input (varl, var2 : tyi; var3 : tya) , 

ovtpQt (resl, res2 : tyj) . 

begin 



register <regnamel> (resl). 
regiater <regname2> (re52) • 
55 texBiaetee (resl & res2; 1). 
end, 

module kennzeichnet den Beginn eines Modules. 
60 input/output definiert die Kn-/Ausgangsvariablen mit den IVpen tyo. 
begin . . . end markieren den Rumpf des Modules. 

register <regnamel/2> iibergibt das Ergebnis an den Output, wobei des Ergebnis in dem durch <regnamel/2> spezifizier- 
ten Register zwischengespeichert wird. <regnamel/2> ist dabei eine globale Referenz auf ein bestimmtes Register 
Als weiterc Ubergabemodi an den Output stehen beispielsweise folgende Speicherarten zur Verfiigung: 
65 fifo <fifonamc>, wobei die Daten an einen nach dem FEFO-Prinzip arbeitenden Speicher iibeigeben werden. fifoname iBt 
dabei eine globale Referenz auf einen bestimmten, im FIFO-Modus arbeitenden Speicher terminate @ wird dabei um 
den Parameter bzw. das Signal, "fifofiill" erweitert, der/das anzeigt, daB der Speicher voU ist. 
stack <stackname>, wobei die Daten an einen nach dem Stack-PHnzip arbeitenden Speicher tibeigeben werden. stack- 
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name ist dabei eine globale Referenz auf einen bestimmten, im Stack-Modus arbeitenden Speichen 
tominate® unterscheidet die Ptogrammierung entsprecbend des erfindungsgem^n Verfahrens von der herkdmmli- 
chen sequentiellen Programmierung. Der Befehl definiert das Abbruchkriterium des Modules. Die Etgebnisvariabien 
resl und res2 weiden von terminate© nicht mit ihrem tatsachlichen Wert evaluiert, statt dessen wild nur die Gtiltigkeit 
der Variablen (also deren Statussignal) gepruft Sind beide Variablen gQltig, terminiert das Modul mit dem Wert 1. Das 
bedeutet, ein Signal mit dem Wert 1 wird an die ubeigeoidneten Ladeeinheit weiteigeleitet, worauffain die ubeigeordne- 
ten Ladeeinheit das nachfolgende Modul ladt. 

module exdmple2 

iaput {varl, var2 : tya; var3 : tyz) . 
output (resl : ty^) . 



register <regnaroel> (varl, var2) . 
♦ • • 

fifo <£ifonainel> (resl, 256). 

(£ifofuH«fifonainel>) ; 1) . 
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register wird in diesem Beispiel iiber input-Daten definiert. Dabei ist <regnamel> dereelbe wie in examplel. Dies be- 
mrkU daB das Register, das die output-Daten in examplel aufhimmt, die input-Daten ftir example zur \%ifugung stellt 
fifo definiert einen FIFO-Speicher der Tiefe 256 fur die Ausgangsdaten resl. Das Full-Flag (fifofiill) des FIFO-Speichers 
wild in terminate® als Abbruchkriterium verwendet. 30 

nodule main 

ii«mt linl^ in2 : tyi; in3 : tya). 

output (outl : tyj. 

begin 

dofiae <regnamel> : register (234 ) . 4o 
d«fiae <regnaine2> ; register (26) . 
define <fifonamel> : fifo(4). 



(varl2, var72) = call examplel (inl, in2, in3) . 

(outl) = call example2 (varl2, var72, var243), 
• • • 

signal (outl). 
*»™iaato8 {exainple2}. 
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define definiert eine Schnittstelle filr Daten (Register, Speicher, etc.). Bei der Definition werden die eiforderlichen Res- 60 
sourcen, sowie die Bezeichnung der Schnittstelle angegeben. Da die Ressourcen eindeutig angegeben weiden und nur 
einmal verwendet werden konnen, ist die Definition global, d. h. die Bezeichnung gilt fur das gesamte Progranun. 
call ruft ein Modul als Unterprogramm auf. 

signal definiert ein Signal als Ausgangssignal, ohne daB eine Zwischenspeicherung verwendet wird 
Durch terminate® (example!) wird das Modul main terminiert, sobald das Unterprogramm example! terminiert. 65 
Durch die globale Deklaration "define . . ." ist es prinzipiell nicht raehr nolwendig, die so definierten input/oulpul Si- 

gnaie in die Schnitlstellen-Deklaration der Module aufzunehmen. Die entsprechend modifizierten Beispiel-Module wiir- 

den dann folgendcrmafien aussehen: 
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5 Die Zustandsinfoimationen des Ptozessonnodells 

Zur Bestimmung der Zustande innerhalb eines Graphen werden die Statusregister der einzelnen Zellen (PAEs) Uber 
ein zusatzlich zum Datenbus (0801) existierendes Status-Bussysiem (0802) alien anderen Rechenwerken zur Verfugung 
gestellt (Fig. 8b). Das bedeutet, daB eine Zelle (PAE X) die Statusinformation einer anderen Zelle (PAE Y) evaluieren 
10 kann und dementsprechend die Daten verarbeitet. Um den Unterschied zu bestehenden Parallerechnersystemen zu ver- 
deullichen, isl in Fig. 8a der Stand der Technik angegeben. Dabei ist ein Multiprozessorsystem gezeigt, dessen Prozes- 
soren iiber einen gemeinsamen Datenbus (0803) miteinander veibQnden sind. Ein explizitesBussystem fiirden synchro- 
nen Austausch von Daten und Status existim nicht 
AbschlieBend soli angem^kt werden, daB je nacb Aufgabe sowohl der Datenflufigr^h, als auch der Kontroliflufigraph 
IS entsprecbend dem beschriebenen Verfahien behaodelt v/crdsa kann. 

Erwdt^ungen in der Hardware gegeniiber PACTQ2 und PACr04 

Durch PACT02 und PACT04 ist der Stand dw Technik in Bezug apf die Konfigurationseigenschaften von Zellen (PA- 
20 Es)definiert und verofifendicht in DE 196 51 075 (PACK)2) sowie in DE 196 54 846 (PACT04). 
Dabei soil auf zwei Hgenschaften eingegangen werden: 

1 . Einer PAE ist gemaB PACT02 dn Satz von Konfigurationsregistein zugeordnet, der eine Konfiguration bdnhal- 
tel (Fig. 8a). 

25 2. Eine Gruppe von PAEs kann gemaB PACT04 auf dnen Speicher zum Speichem oder Lesen von Daten zugieifen 
(Fig. 8b). 

Aufgabe ist es, 

30 a) dn Verfahren zu schaffen, das das Umkonfiguri^en von. PAEs beschleunigt und zddich von der ubergeoidneten 
Ladednhdt entkoppelt, und 

b) das Verfahren so auszulegen, dafi gleichzeitig die Moglichkeit geschafifen wird iiber mehrere Konflgurationen zu 
Sequenzen. 

35 

Entkopplung der Konfigurationsregist^ 

Das Konfigurationsregister wird von der iibeigeordneten Ladeeinheit (CT) entkoppelt (Fig. 9), indem ein Satz von 
mehreren Konfigurationsregistem (0901) verwendet wird. Immer genau eines der Konfigurationsregister bestimmt se- 
40 lektiv die Funklion dar PAE. Die Auswahl des akti yen Registers wird iiber einen Multiplexer (0902) durchgefuhrt. In je- 
des der Konfigurationsregister kann die CP beliebig schreiben, sofem dieses nicht die aktuelle Konfiguration der PAE 
bestimmt. Welches Konfigurationsregister von 0902 selektiert wird kann durch verschiedene Quellen bestimmt werden: 

1 . Hn beliebiges Status-Signal oder dne Gruppe beliebigor Status-Signale, die iiber ein Bussystem (0802) an 0902 
45 gefUhrt werden (Fig. 9a). Die Status-Signale werden dabei von beliebigen PAEs generiert oder durch exteme An- 

schliisse des Bausteins zur Verfiigung gestellt (vgl. Fig. 8). 

2. Das Status-Signal der PAE, die von 0901/0902 konfiguriert wird, dient zur Selekdon (Fig. 9b). 

3. Ein von der iibeigeordneten CT generiertes Signal dient zur Selektion (Fig. 9c). 

50 Dabei ist es moglich wahlweise die eingehenden Signale (0903, 0904, 0905) mittels eines Registers fiir dnen be- 
stimmten Zeitraum zu speichem. 

Durch den Einsatz mehrere Register wird die CT zeitlich entkoppelt. Das bedeutet, die CT kann mehrere Konflgura- 
tionen "vorladen", ohne daB eine direkte zeilliche Abhangigkeit besteht. 
Lediglich das selektierte Register in 0901 noch nicht geiaden ist, wird mit der Konfiguration der PAE so lange gewar- 
55 tet, bis die CT das Register geiaden hat. Um festzustellen, ob ein Register eine giihige Information besitzt kann ein "\%- 
lid-Bit** (0906) pro Register eingefUhrl werden, das von der CT gesetzt wird. Ist 0906 bei einem selektierten Register 
nichi gesetzt, wird iiber ein Signal die CT zum schnellstmoglichen Setzten des Registers aufgefordert 

Das in Fig. 9 beschriebene Verfahren ist einfacb zu einem Sequenzer erweiterbar (Fig. 10). Dazu wird ein Mikrokon- 
troller (1001) zur Ansteuerung d& Selektionssignale des Multiplexers (0902) verwendet Der Sequenzer bestimmt dabei 
60 abhangig von der aktuell selektierten Konfiguration (1002) und ein^ zusStzlichen Statusinformation (1003/1004) die 
nachste zu selektierende Konfiguration. Dabei kann die Statusinformation 

(a) der Status der Status-Signal der PAE, die von 0901/0902 konfiguriert wird sein (Fig. 10a). 

(b) ein beliebiges iiber 0802 zugefuhrtes Statussignal sein (Fig. 10b). 
65 (c) eine Kombination aus (a) und (b) sein. 

Zum einfachen Verstandnis kann 0901 als ein Speicher betrachtel werden, wobei iiber 0902 ein Befehl von 1001 adres- 
siert wird. Die Adressierung ist dabei abhangig vom Befehl selbst und von einem Statusregistec Insoweit entspricht der 
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Aufbau einer "von Neumann" Maschine, mil dem Unterschied, 

(a) der univcrsellen Einsetzbarkeit, also den Sequenzer nicht zu verwenden (vgl. Fig. 9) 

(b) dafi das Statussignal nicht von dem dem Sequenzer zugeordneten Rechenwerk (PA£) generiert werden muB, 
sondern von einem beliebigen anderen Rechenwerk stammen kann (vgl Fig, 10b). 5 

Wichtig ist, daB der Sequenzer dabei Spriinge, insbesondere auch bedingte Spriinge, innerhalb von 0901 ausfxihren 
kann. 

Ein weiteres zusalzliches oder alternatives Verfahren (Fig. 11) zum Aufbau von Sequenzem innerhalb der genannten 
Bausteine ist die Verwendung der intemen Datenspeicher (1101) zum Speichcm der Konfigurationsinformation fur eine lO 
PAE. Dabei wird der Datenausgang eines Speichers auf einen Konfigurationseingang einer PAE geschaltet (1102). Die 
Adresse (1103) fiir 1101 kann dabei von derselben PAE oder einer beliebigen anderen generiert werden. 

Bei diesem Verfahren ist der Sequenzer nicht fest implemendert, sondern wird durch eine PAE oder eine Gruppe von 
PA£s nachgebildet 

15 

Ritentansprtiche 

1. Verfahren zum Ausfiihren von Rrogrammen auf einem Baustein mit ein- oder mehidimensionaler Zellstruktur, 
dadurch gekennzdchnet, dass Datenfluss- oder Kontrollflussgraphen in zeitlich getrennte Ibilgraphen partitioniert 
werden und sequentiell auf den Baustein abgebiidet und ausgefuhrt werden. 20 

2. Hardware mit entkoppeltem Konfiguradonsiegister. 
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